由于其灵活性和适应性,深度学习已成为技术和业务领域的一定大小的解决方案。它是使用不透明模型实施的,不幸的是,这破坏了结果的可信度。为了更好地了解系统的行为,尤其是由时间序列驱动的系统的行为,在深度学习模型中,所谓的可解释的人工智能(XAI)方法是重要的。时间序列数据有两种主要类型的XAI类型,即模型不可屈服和特定于模型。在这项工作中考虑了模型特定的方法。尽管其他方法采用了类激活映射(CAM)或注意机制,但我们将两种策略合并为单个系统,简称为时间加权的时空可解释的多元时间序列(TSEM)。 TSEM结合了RNN和CNN模型的功能,使RNN隐藏单元被用作CNN具有暂时轴的注意力权重。结果表明TSEM优于XCM。就准确性而言,它与Stam相似,同时还满足了许多解释性标准,包括因果关系,忠诚度和时空性。
translated by 谷歌翻译
Automated slicing aims to identify subsets of evaluation data where a trained model performs anomalously. This is an important problem for machine learning pipelines in production since it plays a key role in model debugging and comparison, as well as the diagnosis of fairness issues. Scalability has become a critical requirement for any automated slicing system due to the large search space of possible slices and the growing scale of data. We present Autoslicer, a scalable system that searches for problematic slices through distributed metric computation and hypothesis testing. We develop an efficient strategy that reduces the search space through pruning and prioritization. In the experiments, we show that our search strategy finds most of the anomalous slices by inspecting a small portion of the search space.
translated by 谷歌翻译
ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列,该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战,这是由于探测器的几何形状,不均匀的散射和冰中光的吸收,并且低于100 GEV的光,每个事件产生的信号光子数量相对较少。为了应对这一挑战,可以将ICECUBE事件表示为点云图形,并将图形神经网络(GNN)作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开,对不同的中微子事件类型进行分类,并重建沉积的能量,方向和相互作用顶点。基于仿真,我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术,包括已知系统不确定性的影响。对于中微子事件分类,与当前的IceCube方法相比,GNN以固定的假阳性速率(FPR)提高了信号效率的18%。另外,GNN在固定信号效率下将FPR的降低超过8(低于半百分比)。对于能源,方向和相互作用顶点的重建,与当前最大似然技术相比,分辨率平均提高了13%-20%。当在GPU上运行时,GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件,这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。
translated by 谷歌翻译
决策树在机器学习中非常有名,通常会获得最新的性能。尽管如此,诸如CART,ID3,随机森林和Boosted树之类的知名变体错过了一个概率版本,该版本编码了有关树结构的先前假设,并在节点参数之间共享统计强度。贝叶斯决策树上的现有工作取决于马尔可夫链蒙特卡洛(MCMC),这可能在计算上很慢,尤其是在高维数据和昂贵的建议上。在这项研究中,我们提出了一种在普通笔记本电脑或个人计算机上平行单个MCMC决策树链的方法,使我们能够通过多核处理减少其运行时间,而结果在统计学上与常规顺序实现相同。我们还计算了运行时间的理论和实际减少,可以利用我们的多处理器体系结构的方法获得。实验表明,只要串行和并行实现在统计学上相同,我们可以达到18倍的运行时间。
translated by 谷歌翻译
在治疗方案中应用的机器人,例如在自闭症谱系障碍的个体治疗中,有时被用于模仿学习活动,其中一个人需要由机器人重复运动。为了简化合并机器人可以执行的新运动的任务,希望机器人能够通过观察人类(例如治疗师)的示威来学习动作。在本文中,我们研究了一种从人类的骨骼观察中获取动作的方法,该方法是由以机器人为中心的RGB-D摄像头收集的。给定一系列观察到各种关节,在通过PID位置控制器执行之前,将关节位置映射以匹配机器人的配置。我们通过使用Qtrobot进行一项研究来评估该方法,尤其是繁殖误差,其中机器人从多个参与者中获取了不同的上身舞蹈动作。结果表明该方法的总体可行性,但也表明繁殖质量受骨架观测中噪声的影响。
translated by 谷歌翻译
在针对自闭症谱系障碍患者的机器人辅助治疗中,如果必须手动控制机器人,则在治疗过程中的治疗师工作量会增加。为了允许治疗师专注于与人的互动,机器人应该更加自主,即它应该能够解释该人的状态并根据其行为不断适应其行为。在本文中,我们开发了一个个性化的机器人行为模型,该模型可以在活动期间的机器人决策过程中使用。该行为模型是在从真实交互数据中学到的用户模型的帮助下训练的。我们将Q学习用于此任务,因此结果表明该策略需要大约10,000次迭代才能收敛。因此,我们调查了改善收敛速度的政策转移;我们表明这是一个可行的解决方案,但是不适当的初始政策可以导致最终的最终回报。
translated by 谷歌翻译
尽管机器人可以在大量隔离任务上熟练,但在现实的动态环境中的机器人部署是一个具有挑战性的问题。原因之一是机器人很少配备强大的内省能力,这意味着他们不能总是以合理的方式处理失败。此外,手动诊断通常是一项繁琐的任务,需要技术人员具有相当多的机器人技能。在本文中,我们讨论了我们正在进行的努力 - 在Ropod项目的背景下 - 解决其中一些问题。特别是,我们(i)提出了我们早期开发机器人黑匣子的早期努力,并考虑一些使其设计复杂的因素,(ii)解释我们的组件和系统监控概念,(iii)将远程监控和实验的必要性描述为以及我们最初的执行这些尝试。我们的初步工作打开了一系列有希望的方向,使机器人在实践中更可用和可靠 - 不仅在Ropod的背景下,而且在更一般的意义上也是如此。
translated by 谷歌翻译
生物视觉系统的神经基础在实验上研究很具有挑战性,特别是因为相对于视觉输入,神经元活性变得越来越非线性。人工神经网络(ANN)可以为改善我们对这一复杂系统的理解提供各种目标,不仅充当硅中新假设产生的感觉皮层的预测数字双胞胎,而且还融合了生物启发的建筑主题,以逐步桥接桥梁生物和机器视觉之间的差距。该鼠标最近已成为研究视觉信息处理的流行模型系统,但是尚未确定识别鼠标视觉系统最新模型的标准化大规模基准。为了填补这一空白,我们提出了感官基准竞赛。我们从小鼠初级视觉皮层中收集了一个大规模数据集,其中包含七个小鼠的28,000多个神经元的反应,并通过数千个自然图像刺激,以及同时的行为测量,包括跑步速度,瞳孔扩张和眼动。基准挑战将基于固定测试集​​中神经元响应的预测性能对模型进行对模型,其中包括两个模型输入的轨道,仅限于刺激(感觉到)或刺激加行为(感觉符号+)。我们提供一个起始套件,以降低进入障碍的障碍,包括教程,预训练的基线模型以及带有一条线命令以进行数据加载和提交的API。我们希望将其视为定期挑战和数据发布的起点,也是衡量鼠标视觉系统及其他大规模神经系统识别模型中进度的标准工具。
translated by 谷歌翻译
自动生物医学图像分析的领域至关重要地取决于算法验证的可靠和有意义的性能指标。但是,当前的度量使用通常是不明智的,并且不能反映基本的域名。在这里,我们提出了一个全面的框架,该框架指导研究人员以问题意识的方式选择绩效指标。具体而言,我们专注于生物医学图像分析问题,这些问题可以解释为图像,对象或像素级别的分类任务。该框架首先编译域兴趣 - 目标结构 - ,数据集和算法与输出问题相关的属性的属性与问题指纹相关,同时还将其映射到适当的问题类别,即图像级分类,语义分段,实例,实例细分或对象检测。然后,它指导用户选择和应用一组适当的验证指标的过程,同时使他们意识到与个人选择相关的潜在陷阱。在本文中,我们描述了指标重新加载推荐框架的当前状态,目的是从图像分析社区获得建设性的反馈。当前版本是在由60多个图像分析专家的国际联盟中开发的,将在社区驱动的优化之后公开作为用户友好的工具包提供。
translated by 谷歌翻译
尽管近期因因果推断领域的进展,迄今为止没有关于从观察数据的收集治疗效应估算的方法。对临床实践的结果是,当缺乏随机试验的结果时,没有指导在真实情景中似乎有效的指导。本文提出了一种务实的方法,以获得从观察性研究的治疗效果的初步但稳健地估算,为前线临床医生提供对其治疗策略的信心程度。我们的研究设计适用于一个公开问题,估算Covid-19密集护理患者的拳击机动的治疗效果。
translated by 谷歌翻译